مجلهي غدد درونريز و متابوليسم ايران دانشگاه علوم پزشكي و خدمات بهداشتي درماني شهيد بهشتي دورهي يازدهم شمارهي ۶ صفحههاي ۶۴۶ ۶۳۸ (اسفند ۱۳۸۸) مقايسهي مدلهاي شبكهي عصبي مصنوعي با رگرسيون لجستيك و تحليل مميزي در پيشبيني سندرم متابوليك ۳ ۱ ۲ ۱ مرتضي سدهي دكتر يداله محرابي دكتر انوشيروان كاظمنژاد دكتر فرزاد حداي ق ۱) دانشكدهي پزشكي دانشگاه تربيت مدرس ۲) گروه اپيدميولوژي دانشكدهي بهداشت دانشگاه علوم پزشكي شهيد بهشتي ۳) مركز تحقيقات متابوليسم پژوهشكدهي علوم غدد درونريز و متابوليسم دانشگاه علوم پزشكي و خدمات بهداشتي درماني شهيد بهشتي نشاني مکاتبهي نويسندهي مسي ول: تهران اوين دانشگاه علوم پزشکي شهيد بهشتي دانشکدهي بهداشت گروه اپيدميولوژي دكتر يداله محرابي e-mal:ymehrab@gmal.com چكيده مقدمه: شبكههاي عصبي مصنوعي به عنوان يكي از روشهاي نوين مدلسازي در سالهاي اخير مورد توجه ويژه قرار گرفته است. اين مدلها براي پيشبيني و طبقهبندي در مواردي كه روشهاي كلاسيك ا ماري به خاطر محدوديتهايشان قابل استفاده نيستند كاربرد دارند. هدف از اين مطالعه مقايسهي توانايي مدلهاي شبكه عصبي مصنوعي با رگرسيون لجستيك و تحليل مميزي براي پيشبيني سندرم متابوليك در نمونهاي از افراد شركت كننده در مطالعهي قند و ليپيد تهران بود. مواد و روشها: با استفاده از بانك اطلاعاتي مطالعهي قند و ليپيد تهران ۳۴۷ نفر از افراد شركتكننده در ا ن مطالعه كه در ابتداي فاز اول مطالعه بر اساس تعريف ATP ΙΙΙ نبودند به عنوان نمونه انتخاب شدند. اندازهگيري شاخصهاي تنسنجي سابقهي بيماري قلبي عروقي نمايهي تودهي بدن كلسترول LDL و كلسترول HDL کلسترولتام تريگليسريد قندخون ناشتا قند خون دو ساعته مصرف سيگار فشار خون سيستولي و دياستولي و دور کمر در ابتداي مطالعه ثبت و بروز سندرم متابوليک پس از سه سال پيگيري به عنوان متغير پاسخ در نظر گرفته شد. مدلهاي رگرسيون لجستيك تحليل مميزي و شبكهي عصبي مصنوعي پسانتشار (۱۵:۸:۱) و (۱۵:۱۰:۱) بر دادهها برازش داده شد و پيشبيني بر اساس اين مدلها انجام شد. از تحليل راك و ا مارهي كاپا براي مقايسهي قدرت پيشبيني مدلها استفاده شد. نرمافزار MATLAB به اين منظور مورد استفاده قرار گرفت. يافتهها: مساحت زير منحني راك براي (ROC) مدلهاي رگرسيون لجستيك تحليل مميزي و مدلهاي شبكهي عصبي مصنوعي (۱۵:۸:۱) و (۱۵:۱۰:۱) به ترتيب ۰/۷۴۹ ۰/۷۳۹ و ۰/۷۴۸ و ۰/۸۹۰ به دست ا مد. ميزان حساسيت مدلها به ترتيب ۰/۴۳۵ ۰/۶۷۷ ۰/۴۸۳ و ۰/۸۳۶ و ويژگي ا نها به ترتيب ۰/۹۱۰ ۰/۶۶۰ ۰/۸۵۷ و ۰/۸۸۴ برا ورد شد. اندازهي ا مارهي کاپا براي مدلها به ترتيب ۰/۳۶۳ ۰/۳۲۲ ۰/۳۷۲ و ۰/۷۱۲ بهدست ا مد. نتيجهگيري: يافتهها نشان دادند كه مدل شبكهي عصبي مصنوعي پسانتشار (۱۵:۱۰:۱) نسبت به مدل رگرسيون لجستيك و مدل تحليل مميزي از دقت بيشتري براي پيشبيني سندرم متابوليك در افراد مورد بررسي برخوردار است. پژوهشي مقالهي واژگان کليدي: مدلهاي شبكهي عصبي مصنوعي رگرسيون لجستيك تحليل مميزي سندرم متابوليک دريافت مقاله: ۸۸/۳/۳۱ دريافت اصلاحيه: ۸۸/۷/۱۸ پذيرش مقاله: ۸۸/۸/۴
دكتر مرتضي سدهي و همكاران مدل پنكهي عصبي در پيشبيني سندرم متابوليك ۶۳۹ مقدمه شناسايي الگو و طبقهبندي يكي از مهمترين كاربردهاي روشهاي ا ماري در علوم مختلف است. يكي از اهداف عمدهي مدلسازي و طبقهبندي در ا مار پيشبيني بر اساس واقعيتها و متغيرهاي موجود و اطلاعات در دسترس از يك موضوع خاص است. اين وظيفه در ا مار به طور عمده بر دوش روشهايي مانند رگرسيون تحليل مميزي سريهاي زماني ردهبندي رگرسيون درختي و روشه يا ۱ است. ديگر ا ماري روشهاي كلاسيك ا ماري براي مدلبندي روابط بين متغيرها داراي تعدادي پيشفرض و محدوديت است. در نظر گرفتن يك توزيع پيشفرض مانند توزيع نرمال براي متغيرهاي پاسخ خطي بودن رابطهي پيشنهادي يكسان بودن واريانس خطاها و غيره از جمله محدوديتهاي روشهاي كلاسيك هستند كه هنگام استفادهي عملي از اين روشها اگر دادههاي واقعي شرايط مفروض مدل را نداشته باشند استفاده از اين روشها امكانپذير نبوده يا با خطاي قابل توجه همراه است. علاوه به قابليت مدلبندي روابط پيچيدهي درجهي بالا را ندارند. هيچيك از غير خطي و اثر حساس بودن بيشتر اين اين روشها متقابل مدلها به مشاهدههاي گم شده و دادههاي پرت از ديگر محدوديتهاي ۱ اين روشها به شمار ميا يد. بنابراين نياز به روشهايي كه با محدوديتهاي كمتري در اين زمينه مواجه باشند احساس ميشود. در اين بين مدلهاي شبكهي عصبي مصنوعي ميتوانند يكي از مناسبترين روشها باشند. شبكهي عصبي هيچ فرض اوليهاي بر توزيع دادهها تحميل نميكند ضمن اين كه هيچ محدوديتي نيز براي شكل تابعي رابطهي بين متغيرهاي مستقل و وابسته اعمال نميكند بلكه شبكهي عصبي خود اين رابطهي تابعي را كشف ميكند كه لزوم ا اين رابطه يك رابطهي خطي نيست. از ديگر مزاياي شبكهي عصبي مصنوعي اين است كه در ا ن اطلاعات به صورت ضمني پردازش ميشوند. بر اين اساس چنانچه بخشي از سلولهاي شبكهي حذف شوند يا عملكرد غلط داشته باشند باز هم احتمال رسيدن به پاسخ صحيح وجود دارد ضمن ا ني كه تعميمپذيري شبكهي عصبي اين امكان را ميدهد كه مدل در ارتباط با يك مشاهدهي جديد ا موزش ۲ داده نشده پاسخ مناسبي ارايه دهد. سندرم متابوليك به مجموعهاي از اختلالهاي متابوليك گفته ميشود كه وقوع همزمان ا نها در هر شخص بيشتر از خطر وقوع احتمالي هر يك به تنهايي است. مطالعهها نشان دادهاند كه مرگ و مير ناشي از بيماريهاي قلبي عروقي به طور مشخصي در مبتلايان به سندرم متابوليك بيشتر است. اين سندرم به علت ارتباط با ديابت و بيماريهاي قلبي عروقي و نيز به خاطر شيوع بالا در بين جمعيتها توجه بسياري از محققان را به خود جلب نموده است. جهاني بهداشت (WHO) پژوهشگران سازمان بينالمللي ديابت (IDF) و پانل درماني بزرگسالان (ATPIII) v معيارهايي را ۴ براي سندرم متابوليك اراي ه كردهاند. در تعريف ATPIII از شاخصهاي دور كمر فشارخون تريگليسريد كلسترول تام كلسترولHDL و قند خون ناشتا استفاده شده است. سندرم متابوليك بر اساس چاقي افزايش فشار خون افزايش سطح تريگليسريد پايين بودن كلسترولHDL و افزايش قند خون ناشتا تشخيص داده ميشود. در تعريف ATP III ۴ وجود سه معيار از پنج معيار فوق الزامي است. اين سندرم %۲۳ ۵ جهان غرب را مبتلا كرده است. در ا مريكا شيوع خام و تطبيق داده شده بر اساس سن به ترتيب %۲۱/۸ و %۲۳/۷ ۵ گزارش شده است. در بزرگسالان شيوع جنوبي كرهي تطبيق داده شده بر اساس سن در مردان %۱۴/۲ و در زنان %۱۷/۷ ۵ گزارش شده است. در ايران در مطالعهي عزيزي و همكاران شيوع سندرم متابوليك در جمعيت مورد بررسي %۳۰/۱ و شيوع استاندارد شده بر اساس سن %۳۳/۷ گزارش ۶ شده است. فخرزاده و همكاران در مطالعه خود شيوع سندرم متابوليك در جمعيت مورد بررسي %۲۹/۹ و شيوع تطبيق داده شده با سن را %۲۷/۵ همكاران در مطالعهي ۵ گزارش كردهاند. حداي ق و خود با استفاده از مدل رگرسيون لجستيك به بررسي عوامل مختلف مرتبط با سندرم متابوليك ۳ در بزرگسالان با وزن طبيعي پرداختند. همكاران در مطالعهي خود ضمن بررسي صدر بافقي و شيوع سندرم متابوليك به بررسي عوامل مو ثر بر ا ن نيز پرداختند. در ا ن مطالعه %۳۲/۱ شيوع سندرم متابوليك در جمعيت مورد بررسي ۷ گزارش شد. دانشپور و همکاران نيز در مطالعه - World Health Organzaton - Internatonal Dabetes Federaton v - Adult Treatment Panel -Artfcal Neural Network
دورهي يازدهم, شمارهي ۶ اسفند ۱۳۸۸ مجلهي غدد درون ۶۴۰ ريز و متابوليسم ايران خود عوامل مرتبط با سندرم متابوليك را با استفاده از تحليل عاملي بررسي بيماريها ۸ كردند. با توجه به مرگ و مير ناشي از اين و بار عظيم اقتصادي ناشي از ا نها ارايهي مدلهايي كه با دقت بتواند ابتلا به سندرم متابوليك را در افراد پيشبيني نمايد از اهميت ويژهاي ۳ برخوردار است. هدف از اين مطالعه پيشبيني ابتلا به سندرم متابوليك با استفاده از مدل شبكهي عصبي مصنوعي و مقايسهي دقت با مدل اين پيشبيني روشهاي مرسوم ا ماري مانند رگرسيون لجستيك و تحليل مميزي بود. لازم به ذكر است كه در اين مطالعه هدف اصلي تنها مقايسهي قدرت پيشبيني مدلهاي مختلف مورد بحث بود و از مباحث پيچيده دربارهي اصول كار و طراحي شبكههاي عصبي مصنوعي صرفنظر شده است. k رگرسيون لجستيك: يكي از ابزارهاي ا ماري است كه به منظور مدلسازي و تحليل دادهها از ا ن استفاده ميشود. رگرسيون لجستيك داراي شكل كلي زير است: log π 1 π = α + = 1 β. x احتمال تعلق π مدل اين در فرد به سطح اول متغير وابسته است χ متغير مستقل ام و β ضريب برا ورد شده مدل براي متغير مستقل ام است. از مزاياي استفاده از مدل رگرسيون لجستيك علاوه بر مدلسازي مشاهدهها امكان پيشبيني احتمال تعلق هر فرد به هر يك از سطوح متغير وابسته و همچنين امكان محاسبهي استفاده از ضرايب مدل ۹ است. مستقيم نسبت شانس با تحليل مميزي: تحليل مميزي تكنيك چند متغيره است كه با جدا كردن مجموعههاي متمايز مشاهدهها و با تخصيص مشاهدههاي جديد به دستههاي از پيش تعريف شده سر و كار دارند. مسا لهي ا ماري در وجود ا وردن يك به مورد قانون (تابع تشخيص) بر مبناي اندازههاي حاصل از افراد ميباشد. با استفاده از اين قانون ميتوان افراد جديد را كه معلوم نيست از كدام جمعيت هستند به يكي از جمعيتها منتسب كرد. از معروفترين توابع مورد استفاده در تحليل مميزي ميتوان به تابع مميز فيشر اشاره كرد. ديگر هزينه قاعدهي (ECM) ردهبندي با به دست ميا يد. به حداقل رساندن در روش تابع متوسط براي جامعههاي نرمال با واريانس مساوي از قاعدهي TPM براي ردهبندي استفاده ۹ ميشود. شبكهي عصبي مصنوعي: شبكههاي عصبي مصنوعي براي تشخيص طبقهبندي و پيشبيني كه در ا نها روابط معمو لا ميگيرند. به شكل غيرخطي هستند مورد استفاده قرار مبحث شبكهي عصبي مصنوعي مربوط به شبيهسازي قوهي يادگيري در انسان و پيادهسازي ا ن به صورت الگوريتمهاي كامپيوتري است. شبكههاي عصبي يكي از پوياترين حوزههاي پژوهش در دوران معاصر ميباشد كه افراد متعددي از رشتههاي گوناگون علمي را به خود جلب كرده است. فلسفهي اصلي محاسبههاي شبكههاي عصبي مصنوعي مدلسازي عمدهي ويژگيهاي مغز و نحوه عملكرد ا ن در جهت ساخت مدلهايي است كه بتواند ويژگيهاي مفيد ۱۰ مغز را حتي الامكان از خود بروز دهد. مغز به عنوان يك سيستم پردازش موازي از حدود ۱۰ ۱۱ نورون به هم مرتبط با ۱۰ ۱۶ ارتباط نوروني تشكيل شده- ۵ است. نورونها از سه قسمت اصلي بدنهي سلولي دندريت عناصر v و ا كسون ارتباطي نورون تشكيل ميشوند. هستند. دو قسمت اخير دندريتها سيگنالهاي الكتريكي را به هستهي سلول منتقل ميكنند. بدنهي سلول انرژي لازم را براي فعاليت سلول فراهم نموده بر سيگنال- هاي دريافتي يكسري اعمال انجام ميدهد. ا كسون بر خلاف دندريت از سطحي هموارتر و تعداد شاخههاي برخوردار است. كمتري ا كسون طول بيشتري دارد و سيگنال الكتروشيميايي دريافتي از هستهي سلول را به نورون ديگر منتقل ميكند. مشابه با يك نورون منفرد يك شبكهي عصبي نيز داراي وروديهايي است كه سيگنالهاي ورودي شبكه از اندامهاي حساس شبكهي و يا ديگر شبكهها هستند و عصبي خروجيهايي را توليد منفرد نورون مانند ميكند كه به ساير شبكهها يا اعضا منتقل ميشوند اما خروجي شبكه متفاوت از خروجي يك نورون تنها است زيرا لزوم ا شامل يك تك مقدار نميباشد بلكه ميتواند شامل تعداد زيادي از مقادير خروجي باشد. مانند نورون منفرد شبكهي خروجيهايش را به عنوان تابعي از وروديهايش محاسبه ميكند اما به دليل اين كه قدرت ارتباط بين نورونها در شبكه قابل تغيير است رابطه - Soma - Dendrte v- Axon Odds Rato (OR)
دكتر مرتضي سدهي و همكاران مدل شبكهي عصبي در پيشبيني سندرم متابوليك ۶۴۱ بين خروجيهاي شبكه ميتواند بنا به تجربه با وروديهاي ا ن تغيير كند. فرايند را اين ۱۱ عصبي مصنوعي مينامند. در اصطلاح يادگيري شبکهي مسا لهي مدلسازي مغز از روي مدلسازي تك نورون عصبي شروع شد و مدل نورون وارن كلوش و والتر پيتز (۱۹۴۳ ( اولين تلاش براي اين ۱۱ كار بود. در اين مدل هر اتصال داراي وزني است كه سيناپس ناميده ميشود و به W j وسيلهي نشان داده شده و به عنوان ميزاني از قدرت اتصال از واحد j ام به واحد ام در نظر گرفته شده است. ورودي هر واحد مجموع وزن خروجي ديگر متصل به ا ن است. j بنابراين ورودي واحد ام عبارت است از: كه در ا ن W س س پ Net _ nput w output + w = j j مقدار ا ستانهي واحد ام است. تابع محرك بر اين مجموع عمل ميكند كه مقدار اين تابع مقدار محرك ا ن واحد ناميده ميشود. در يك شبكه عصبي نورونها در لايههاي مختلف طبقهبندي ميشوند. لايهي ورودي مشتمل بر نورونهايي است كه ورودي را از محيط خارج دريافت ميكنند. لايهي خروجي نيز مشتمل بر نورونهايي است كه خروجي سيستم را به محيط خارجي يا كاربر يا طراح سيستم ارايه ميدهد. علاوه بر لايههاي ورودي و خروجي ممكن است يك يا چند لايهي نهاني نيز بين اين دو لايه در نظر گرفته شود كه تعداد اين لايهها به ساختار شبكه ساختار دادهها و بستگي دارد. هنگامي كه لايهي شيوهي طراحي شبكه ورودي داده را دريافت ميكند نورونهاي ا ن لايه خروجي را توليد ميکند كه همين خروجي به عنوان ورودي لايهي بعدي در نظر گرفته ميشود. اين مراحل به همين ترتيب ادامه پيدا ميكند تا اين كه شرط معين و مورد نظر براي پايان فرايند يادگيري برقرار گردد. سپس لايهي خروجي نتيجهي شبكه را ارايه ميدهد و فرايند به اتمام ميرسد. نهاني شبكه براي طراحي شبكه بستگي به ميزان بهينهسازي شبكه دارد. تعيين تعداد نورونهاي لايههاي الزامي است و تعداد ا ن در واقع ا نقدر نورون به لايهي نهاني افزوده ميشود تا كارايي شبكه بهينه شود. البته بايد در نظر داشت كه افزايش بيرويهي تعداد نورونهاي لايهي نهاني ممكن است باعث بيشبرازش مدل شود. شبكه بهعبارت ديگر اين به امكان شبكه حتي خطاهاي مستتر در دادهها را نيز فرا وجود ميا يد كه تابع محرك ميتواند خطي يا غير خطي باشد. يك تابع محرك بر اساس نياز خاص حل مسا له انتخاب ميشود. در عمل تعداد محدودي از توابع محرك مورد استفاده قرار ميگيرند كه از بين ا نها ميتوان به تابع ا ستانهاي دو مقدارهي متقارن تابع ا ستانهاي دومقداره تابع هماني تابع خطي مثبت ۱۱ اشاره كرد. تابع سيگموي يدي و تابع تانژانت هايپربوليك مدل ساده تك ورودي: مدل رياضي اين شبكه را ميتوان به صورت b) a = f (WP + نشان داد. اسكالرهاي a و P به ترتيب خروجي و ورودي هستند. a = f (WP + b) شكل ۱- مدل رياضي نورون تا ثير P بر a به وسيلهي مقدار وزن w تعيين ميشود. b را باياس ميگويند و خاصيت ا ن ا ني است كه ورودي نورون همواره برابر يك است. در مقايسهي اين نورون تك ورودي با يك نورون بيولوژيك w معادل شدت سيناپس مجموعهي جمعكننده و تابع محرك معادل هسته و بدنهي سلول و a معادل سيگنال گذرنده از ا كسون است. نكتهي قابل توجه اهميت و تا ثير جملهي باياس است. اين جمله را ميتوان مانند ديگر وزنها در نظر گرفت با اين تصور كه ميزان تا ثير ورودي ثابت ۱ را بر نورون منعكس ميكند. بايد توجه داشت كه متغيرهاي w و b قابل تنظيم هستند و تابع محرك f نيز توسط طراح شبكه عصبي انتخاب ميشود. بر اساس انتخاب f و نوع الگوريتم يادگيري متغيرهاي w و b تنظيم ميشوند. يادگيري به اين معني است كه w و b طوري تغيير ميكنند كه رابطهي ورودي و خروجي نورون با هدف خاصي مطابقت ۱۱ نمايد. ] مدل چند ورودي: به طور عمومي يك شبكه بيش از يك ورودي دارد. در اين حالت شكل ماتريسي ساختار شبكه به صورت زير است : W P W n = WP ' + b = PW = [ W 11 + b,...,. Actvaton Functon R n = 1 W 1R ], 1 f + b a P = [ P,..., 1 P R ۱۰ گيرد.
دورهي يازدهم, شمارهي ۶ اسفند ۱۳۸۸ مجلهي غدد درون ۶۴۲ ريز و متابوليسم ايران تعداد عناصر ب ردار ورودي با توجه به بررسي تعيين ميشود. مسا له مورد يادگيري: فرايند يادگيري در واقع مشخص كردن ارتباط بين ورودي و خروجي در طول زمان با تكرار فرايند است. ميدانيم كه تجربهها در طول زمان حاصل ميشوند و به عبارت ديگر هيچكس ا يندهي ميزان يادگيري ما به درجهي خود را تجربه نكرده است. كامل بودن اطلاعات قبلي ۱۲ بستگي دارد. در حالت كلي سه نوع يادگيري در شبكهي عصبي مصنوعي وجود دارد: روش اول يادگيري با ناظر است. در اين روش فرض بر اين است كه در هر مرحله از تكرار الگوريتم جواب مطلوب سامانهي ا ني يادگيرنده از قبل ا ماده است به عبارت ديگر الگوريتم يادگيري به جواب واقعي و مطلوب دسترسي دارد كه ميتوان خروجي شبكه را با ا ن مقايسه نمود. روش دوم يادگيري بدون ناظر يا خودسازمانده است كه در ا ن به جواب مطلوب و مقدار واقعي پاسخ براي بهبود رفتار سامانه يادگيرنده دسترسي نداريم و خود شبكه بايد در بين وروديها اين كار را انجام دهد. يك اشكال يادگيري با ناظر است كه شبكهي عصبي ممكن است بدون معلم نتواند مواضع جديدي را كه توسط مجموعهي دادههاي جديد تجربي پوشانده نشده است ياد بگيرد. روش سوم يادگيري تشديد ي يا تقويتي است كه ميكند. اين محدوديت را برطرف يكي از معماريهاي شبكههاي عصبي مصنوعي كه به طور گستردهاي به كار ميرود و در راستاي يادگيري با ناظر قرار دارد پرسپترون چند لايه v (MLP) است كه از ا ن به ۱۰ v عنوان تقريبزن كلي ياد ميشود. در پرسپترون يادگيري توسط كمينه كردن ميانگين مربعهاي كارگيري به الگوريتم يادگيري پس انتشار ۱۲ قاعدهي دلتاي تعميم يافته حاصل ميشود. خروجي و با به v ( BP) خطا يا براي ا موزش شبكه كه تقريب ا شبيه برا ورد ضرايب در رگرسيون است تعدادي از نمونهها به تصادف انتخاب شده درون شبكه فرستاده ميشوند. در دادههاي ا موزشي وضعيت واقعي طبقهاي كه نمونه به ا ن تعلق دارد مشخص است (يادگيري با ناظر). اعتبار شبكههاي عصبي مصنوعي با استفاده از دادههاي ا زمون و ۱۲ مورد بررسي قرار ميگيرد. در اين مطالعه v روشهاي اعتبار مقطعي از مدلهاي شبکهي عصبي مصنوعي براي پيشبيني سندرم متابوليک استفاده و سپس يافتهها حاصل با دو روش ا ماري مرسوم يعني تحليل مميزي و رگرسيون لجستيک مقايسه شدند. مواد و روشها دادههاي مورد استفاده در اين پژوهش از مطالعهي قند و ليپيد تهران به دست ا مد. مطالعهي قند و ليپيد يك مطالعهي ا يندهنگر بود كه در جمعيت نمايندهاي از ساكنان منطقه ۱۳ تهران با هدف تخمين ميزان شيوع اختلالهاي متابوليك و شناسايي عوامل خطرساز بيماريهاي قلبي عروقي انجام شد. در ا ن مطالعه ۱۵۰۰۵ نفر از جامعهي شهري تهران به صورت تصادفي انتخاب شدند كه از بين ا نها ۱۰۳۶۸ فرد سال ۲۰ بالاي در سال ۱۳۷۹ در فاز اول مطالعه مورد بررسي قرار گرفتند. افراد شركتكننده در پژوهش حاضر شامل از بودند نفر ۳۴۷ كه در ارتباط با ابتلا به سندرم متابوليك بررسي شدند. اين افراد در فاز اول مطالعه (۱۳۸۱-۱۳۷۹) به سندرم متابوليک مبتلا نبوده و پس از حدود سه سال پيگيري در فاز دوم مطالعه مجدد ا بررسي شدند كه ۱۲۲ نفر از ا نها براساس معيارΙΙΙ ATP به سندرم متابوليك مبتلا شدند. متغيرهاي مورد بررسي در اين مطالعه عبارت بودند سن جنس وضعيت تا هل سابقه بيماريهاي قلبي عروقي نمايهي تودهي بدن LDL (BMI) HDL کلسترول تام تريگليسريد قندخون ناشتا قند خون دو ساعته مصرف سيگار (هرگز گاهي هميشه) فشارخون سيستولي فشار خون دياستولي و دور کمر كه اندازهگيري همهي ا نها در فاز ۱ مطالعهي قند و ليپيد تهران انجام شده بود. با توجه به مقايسهي اين كه هدف اصلي ما در اين پژوهش دقت مدلهاي مختلف براي پيشبيني سندرم متابوليك بود بايست با استفاده از معيارهاي ا ماري مناسب مقايسهاي بين مدلهاي مختلف انجام ميشد تا در صورت لزوم بتوان يكي از ا نها را به عنوان مدل بهينه انتخاب نمود و مورد استفاده قرار داد. با توجه به دو سطحي بودن متغير v- Cross Valdaton. Supervsed Learnng - Unsupervsed Learnng - Renforcement Learnng v. Mult Layer Perceptron (MLP) v. Unversal Approxmator v. Back Propogaton
دكتر مرتضي سدهي و همكاران مدل شبكهي عصبي در پيشبيني سندرم متابوليك ۶۴۳ پاسخ يك ملاك مناسب براي سنجش كيفيت مدلهاي برازش شده و تعيين توان پيشبيني صحيح ا نها استفاده از سطح زير منحني مشخصهي عملكرد (ROC) است. اين منحني عبارت است از حساسيت برحسب يك منهاي ويژگي و مساحت زير ا ن كه عددي بين ۰ و ۱ است و به عنوان ملاكي براي سنجش توانايي پيشبيني مدلها مورد استفاده قرار ميگيرد. هر چه اين عدد به ۱ نزديكتر باشد نشانهي تواناتر بودن مدل براي پيش ۱۳ بيني است. جدول ۱- مقايسهي مقادير ميانگين متغيرهاي ك مي پايه در مبتلايان و غير مبتلايان به سندرم متابوليك سن (سال) نمايهي تودهي بدن (كيلوگرم بر متر مربع) كلسترول تام (ميليگرم بر دسيليتر) كلسترول LDL (ميليگرم بر دسيليتر) قند خون دو ساعته (ميليگرم بر دسيليتر) فشارخون سيستولي (ميليمتر جيوه) فشارخون دياستولي (ميليمتر جيوه) دور كمر (سانتيمتر) قند خون ناشتا (ميليگرم بر دسيليتر) تريگليسريد (ميليگرم بر دسيليتر) كلسترول HDL (ميليگرم بر دسيليتر) غير مقدار P ۰/۰۲۹ ۰/۰۰۱ ۰/۰۸۷ ۰/۰۹۷ ۰/۹۸ ۰/۰۰۹ ۰/۰۳۸ ۰/۰۰۱ ۰/۰۱ ۰/۰۰۱ ۰/۰۰۲ ۴۶/۱ ± ۱۳/۲۱ ۲۵/۹ ± ۴/۰۲ ۲۰۵/۸ ± ۳۹/۳۳ ۱۳۳/۷ ± ۳۴/۲۵ ۱۳۰/۸ ± ۳۳/۰۳ ۱۱۶/۱ ± ۱۷/۲۶ ۷۵/۳ ± ۹/۸۴ ۸۶/۰ ± ۹/۶۴ ۹۰/۷ ± ۹/۵۶ ۱۲۹/۷ ± ۵۵/۴۴ ۴۶/۱ ± ۲۰/۸۹ ۴۹/۳ ± ۱۲/۸۸ ۲۷/۸ ± ۴/۱۱ ۲۱۳/۵ ± ۴۰/۸۸ ۱۴۰/۲ ± ۳۵/۵۶ ۱۳۰/۷ ± ۳۰/۹۶ ۱۲۱/۳ ± ۱۸/۱۷ ۷۷/۷ ± ۹/۹۰ ۹۰/۶± ۱۰/۱۰ ۹۳/۴ ± ۹/۶۶ ۱۵۵/۴ ± ۷۷/۸ ۴۲/۲ ± ۱۱/۹۸ جدول ۲- مقايسهي شيوع متغيرهاي كيفي در مبتلايان و غير مبتلايان به سندرم متابوليك جنس (مرد) وضعيت تا هل (متا هل) سابقهي بيماري قلبي عروقي (دارد) مصرف سيگار (سيگاري) غير مقدار P ۰/۹۷۲ ۰/۳۴۱ ۰/۷۳۷ ۰/۳۹۵ % ۴۴/۹ % ۹۶/۴ % ۴/۹ % ۱۸/۲ % ۴۵/۱ % ۹۱/۸ % ۴/۱ % ۲۲/۱ ابتدا از نيمي از دادهها (۱۷۳ نفر) براي برازش مدلها و ا موزش شبکهي عصبي مصنوعي و سپس از نيم ديگر (۱۷۴ نفر) براي بررسي دقت پيشبيني استفاده شد. براي برازش مدل رگرسيون لجستيك روش حذف پسرو و براي تحليل مميزي روش لانداي ويلك بهکار رفت. براي طراحي مدل شبكهي عصبي مصنوعي ابتدا يك شبكهي پرسپترون دو لايه (۱ ۱۵) : ۸ : با الگوريتم پسانتشار خطا و نرخ يادگيري هايپربوليك و حداكثر خطاي ۰/۰۰۱ ۰/۱ تابع انتقال تانژانت به وجود ا مد و در مرحلهي بعد با اضافه كردن دو نورون به لايهي مياني يك شبكهي پرسپترون دو لايه (۱ ۱۵) : ۱۰ : با متغيرهاي مشابه برازش داده شد. براي برازش مدل رگرسيون لجستيک و تحليل مميزي از نرمافزارSPSS ۱۶ نسخهي عصبي مصنوعي از نرمافزار استفاده شده از براي شد. مقايسهي سطح زيرمنحني راك حساسيت و ويژگي استفاده شد. و براي برازش مدل شبکهي MATLAB نسخهي ۲۰۰۸ دقت پيشبيني مدلهاي ارايه ا مارهي كاپا و مقادير. Backward -Wlk ' s Lambda
دورهي يازدهم, شمارهي ۶ اسفند ۱۳۸۸ مجلهي غدد درون ۶۴۴ ريز و متابوليسم ايران ۲ و ۱ جداول يافتهها اطلاعات توصيفي مربوط به متغيرهاي مورد بررسي را ارايه ميدهند. براساس اطلاعات ارايه شده در جدول ۳ مدل رگرسيون لجستيك وضعيت %۷۲/۴ مدل تحليل مميزي وضعيت %۶۶/۷ مدل شبكهي عصبي (۱: ۱۵) ۸: وضعيت %۷۳/۶ و در نهايت مدل شبكهي عصبي (۱: ۱۵) ۱۰: وضعيت %۸۷/۴ افراد سالم يا را به جدول ۳- طبقهبندي افراد مورد بررسي عصبي مصنوعي پيشبيني مدل رگرسيون لجستيک تحليل مميزي سالم سالم درستي پيشبيني كردهاند. رگرسيون لجستيک و مدل شبکه (۱۵:۸:۱) داراي حساسيت پايين ولي ويژگي به نسبت بالايي هستند. مدل شبکهي عصبي (۱۵:۱۰:۱) داراي بالاترين نسبت درستنمايي مثبت و پايينترين نسبت درستنمايي منفي ميباشد (جدول ۴). بر اساس پيش بيني مدلهاي رگرسيون لجستيك تحليل مميزي و مدلهاي شبكهي سالم ۹۶ (۵۵/۲)* وضعيت واقعي سندرم متابوليك ۳۲ (۱۸/۴) ۳۰ (۱۷/۲) ۲۰ (۱۱/۵) ۴۲ (۲۴/۲) ۱۶ (۹/۲) ۷۴ (۴۲/۵) ۳۸ (۲۱/۸) شبکهي عصبي :۱) (۱۵ : ۸ سالم ۳۵ (۲۰/۱) ۲۷ (۱۵/۵) ۱۰۲ (۵۸/۶) ۱۰ (۵/۷) ۱۰(۵/۷) ۵۲ (۲۹/۹) ۱۰۰ (۵۷/۵) ۱۲ (۶/۹) شبکهي عصبي :۱) (۱۵ : ۱۰ سالم * اعداد داخل پرانتز درصد نسبت به کل را نشان ميدهند. جدول ۴- حساسيت ويژگي, ا مارهي كاپا و سطح زير منحني راك (ROC) براي مدلهاي مختلف مدل رگرسيون لجستيک تحليل مميزي حساسيت ويژگي LR- LR+* ا ماره کاپا سطح زير منحني راك ۰/۷۴۹ ۰/۷۳۹ ۰/۷۴۸ ۰/۸۹۰ ۰/ ۳۲۲ ۰/۳۶۳ ۰/۳۷۲ ۰/۷۱۲ ۰/۶۰ ۰/۴۹ ۰/۶۲ ۰/۱۹ ۳/۳۸ ۱/۹۹ ۴/۸۳ ۷/۲۱ ۰/۸۵۷ ۰/۶۶ ۰/۹۱ ۰/۸۸۴ ۰/۴۸۳ ۰/۶۷۷ ۰/۴۳۵ ۰/۸۳۶ شبکهي عصبي ۱) (۱۵ : ۸ : شبکهي عصبي ۱) (۱۵ : ۱۰ : *نسبت درستنمايي مثبت Rato) (Postve Lkelhood نسبت درستنمايي منفي Rato) (Negatve Lkelhood
دكتر مرتضي سدهي و همكاران مدل شبكهي عصبي در پيشبيني سندرم متابوليك ۶۴۵ راك منحني براي مدلهاي مورد بررسي در نمودار ۱ نشان داده شده است. بر اساس اين نمودار سطح زير منحني ROC براي مدلهاي رگرسيون لجستيك تحليل مميزي شبكهي عصبي مصنوعي (۱۵:۸:۱) و بالاخره شبكهي عصبي مصنوعي :۱) (۱۵ :۱۰ به ترتيب ۰/۷۴۸ ۰/۷۳۹ ۰/۷۴۹ و ۰/۸۹۰ بهدست ا مد. نمودار ۱- منحني راك پيشبيني مدلها (ROC) براي مقايسهي قدرت بحث با توجه به اهميت سندرم متابوليك به عنوان يك عامل خطرساز مهم براي بيماريهاي قلبي عروقي و ديابت دسترسي به مدلهايي كه با دقت بالا بتواند اين بيماري را در افراد پيشبيني نمايد مورد توجه است. در اين مطالعه چهار مدل مختلف براي پيشبيني سندرم متابوليك در افراد استفاده و يافتههاي حاصل مقايسه شدند. با توجه به نتايج اراي ه شده مدل شبکه عصبي مصنوعي (۱ ۱۵) ۱۰: : داراي بيشترين حساسيت و در مقابل مدل شبکهي عصبي (۱ : ۸ : ۱۵) داراي کمترين حساسيت بود. به عبارت ديگر با افزايش گرههاي لايهي تعداد مياني شبکه قدرت تشخيص صحيح افراد مبتلا توسط مدل شبکهي عصبي به طور قابل ملاحظهاي افزايش يافت. اين به ا ن معنا است كه تغيير تعداد گرههاي لايهي مياني ميتواند تا ثير زيادي يافتههاي بر حاصل از مدلها داشته باشد. بنابراين در هنگام طراحي مدل شبكهي عصبي مصنوعي بايد در انتخاب تعداد گرههاي لايهي مياني دقت لازم را به عمل ا ورد. از طرفي با بررسي ويژگي در مييابيم بيمار توسط مدل شبکهي عصبي (۱ : ۸ : که قدرت تشخيص صحيح افراد غير ۱۵) بالاتر از قدرت مدل شبکهي عصبي (۱ ۱۵) : ۱۰ : است که مانند رگرسيون لجستيک عمل ميكند. بر اساس ا مارهي کاپا مدل شبکهي عصبي (۱ ۱۵) : ۱۰ : با اختلاف زيادي بهترين عملکرد را بين مدلهاي ارايه شده دارد. مقايسهي دو مدل شبکهي مصنوعي ارايه شده نشان ميدهد که تغيير کردن تعداد نورونهاي لايههاي مياني تا چه اندازه ميتواند در عملکرد مدل تا ثير داشته باشد. ضمن ا ني كه شبكههاي عصبي مصنوعي مفروضات و محدوديتهاي معمول در روشهاي كلاسيك را نيز ندارند كه اين مسا له خود مزيت بسيار بزرگي به حساب ميا يد. با اضافه كردن سلولهاي لايهي تعداد مياني در شبكهي عصبي مصنوعي ميتوان دقت پيشبيني را بالا برد اما در اينجا خطري كه مدل شبكه را تهديد پذيري شبكه مشكل ايجاد ميكند. است كه براي تعميم ميكند بيش برازش مطالعههايي كه تا به حال در ارتباط با مدلسازي ا ماري ۳ ۸ دربارهي سندرم متابوليك انجام شده است به طور عمده با هدف بررسي عوامل مو ثر بر سندرم متابوليك انجام شدهاند اما در مطالعهي حاضر هدف مقايسهي صحت و دقت پيشبيني مدلهاي موجود ا ماري و مقايسهي با ا ن صحت و دقت مدل پيشنهادي شبكهي عصبي بود كه تا پيش از اين مطالعه بررسي نشده بود. تاكنون استنباطهايي براي شبكههاي عصبي مانند ا نچه كه در علم ا مار براي مدلسازي و ارزيابي ا نها وجود دارد ارايه نشدهاست و مدلسازي بيشتر بر اساس الگوريتم ا موزشي مورد نظر انجام ميشود. بنابراين تا حدودي تابع سليقه و انتخابهاي اوليهي پژوهشگر است. در اين زمينه برخي سو الها نيز در ارتباط با چگونگي طراحي معماري مناسب و توپولوژي بهينه براي شبكهي عصبي تشخيص تعداد لايههاي پنهان و تعداد سلولهاي موجود در هر لايه - Overfttng
دورهي يازدهم, شمارهي ۶ اسفند ۱۳۸۸ مجلهي غدد درون ۶۴۶ ريز و متابوليسم ايران ذهن پژوهشگران را به خود مشغول داشته كه علاقمندان ۱۴ در ميتوانند در اين عرصه به منابع موجود مراجعه نمايند. برخي مطالعههايي كه از روشهاي رگرسيون لجستيك و تحليل مميزي براي پيشبيني استفاده كردهاند مدل رگرسيون لجستيك يافتههاي دقيقتري نسبت به تحليل ۱۳ مميزي ارايه دادهاست اما در مطالعهي حاضر اين موضوع تا ييد نشد. اگرچه براي بررسي دقيقتر موضوع مطالعههاي جامعتر بهويژه با استفاده از شبيهسازي پيشنهاد ميشود. سپاسگزاري: از پژوهشكدهي علوم غدد درونريز و متابوليسم دانشگاه علوم پزشكي شهيد بهشتي كه دادههاي اين مطالعه را در اختيار پژوهشگران قرار دادند سپاسگزاري مينماييم. همچنين از همكاري صميمانهي ا قاي اكبر بيگلريان دانشجوي دکتراي ا مار زيستي دانشگاه تربيت مدرس و سركار خانم مريم صفرخاني كارشناس ارشد واحد ا مار پژوهشكدهي علوم غدد درونريز و متابوليسم كمال تشكر و قدرداني را به عمل ميا وريم. References 1. Hagan MT, Neural network desgn, PWS, USA; 1995. 2. Anderson A, An ntroducton to neural network, Cambrdge, MA: MIT press; 1995. 3. Hadaegh F, Zabetan A, Harat H, Azz F. Metabolc syndrome n normal-weght Iranan adults, Ann Saud Med 2007; 27: 18-24. 4. Hadaegh F, Ghasem A, Padyab M. Assessment of dfferent defntons of metabolc syndrome n ncdence of dabetes n Iranan urban: Tehran Lpd and Glucose Study. Journal of Iranan Dabetes and Lpd 2008; 3: 343-353. [Fars] 5. Fakhrzadeh H, Ebrahmpour P, Nour M. Survey of prevalence of metabolc syndrome and ts rsk factors n an urban populaton. Journal of Iranan Dabetes and Lpd 2005; 3: 278-288. [Fars] 6. Azz F, Saleh P, Etemad A, Zahed-Asl S. Prevalence of metabolc syndrome n an urban populaton: Tehran Lpd and Glucose Study. Dabetes Res Cln Pract 2003 Jul;61: 29-37. 7. Sadr-Bafgh S. M, Salar M, Rafe M, Nemayande S. M. Survey of prevalence of metabolc syndrome and ts factors n an urban populaton. Journal of Medcne Dep, Tehran Unversty Medcal Journal 2007; 64: 90-6. [Fars] 8. Danesh-Pour M. S, Mehrab Y, Hedayat M., Azz F, Multvarable survey of factors correlated wth metabolc syndrome usng factor analyss. Iranan Journal of Endocrnology and Metabolsm 2006; 30: 139-146. [Fars] 9. Jobson D.J, Appled multvarate data analyss, Sprnger, USA, 1992. 10. Menhaj M.B, Bascs of neural network, Prof Hesab Ins., Tehran, 2005. 11. Hagan M.T, Neural networks desgn, PSW, USA, 1996. 12. Dayhoff JE, Neural network archtectures, VNR, USA, 1990. 13. Sadat Hashem S. M., Ghorban R., Kave B. Analyzng recever operatng characterstc curves to compare medcal dagnostc tests. Koomesh, Journal of Semnan Unversty of Medcal Scences, 2003; 2: 145-149. [Fars] 14. Tu JV. Advantages and dsadvantages of usng artfcal neural networks versus logstc regresson for predctng medcal outcomes. J Cln Epdemol 1996; 49: 1225-31.
731/Iranan Journal of Endocrnology & Metabolsm Vol 11 No. 6 March 2010 Orgnal Artcle Comparson of Artfcal Neural Network, Logstc Regresson and Dscrmnant Analyss Methods n Predcton of Metabolc Syndrome Sedeh M 1, Mehrab Y 2, Kazemnejad A 1, Hadaegh F 3 1 Faculty of Medcne, Tarbat Modares Unversty, 2 Department of Epdemology, School of Publc Health, and 3 Preventon of Metabolc Dsorders Research Center, Research Insttute for Endocrne Scences, Shahd Behesht Unversty of Medcal Scences,Tehran, Iran e-mal:ymehrab@gmal.com Receved: 16/07/2009 Accepted: 26/10/2009 Abstract Introducton: Artfcal neural networks as a modern modelng method have receved consderable attenton n recent years. The models are used n predcton and classfcaton n stuatons where classc statstcal models have restrcted applcaton when some, or all of ther assumptons are met. Ths study s amed to compare the ablty of neural network models to dscrmnant analyss and logstc regresson models n predctng the metabolc syndrome. Materals & Methods: A total of 347 partcpants from the cohort of the Tehran Lpd and Glucose Study (TLGS) were studed. The subjects were free of metabolc syndrome at baselng accordng to the ATPIII crtera. Demographc characterstcs, hstory of coronary artery dsease, body mass ndex, wast, LDL, HDL, total cholesterol, trglycerdes, fastng and 2 hours blood sugar, smokng, systolc and dastolc blood pressure were measured at baselne. Incdence of metabolc syndrome after about 3 years of follow up was consdered a dependent varable. Logstc regresson, dscrmnant analyss and neural network models were ftted to the data. The ablty of the models n predctng metabolc syndrome was compared usng ROC analyss and the Kappa statstc, for whch, MATLAB software was used. Results: The areas under recever operatng characterstc (ROC) curve for logstc regresson, dscrmnant analyss and artfcal neural network models (15: 8: 1) and (15: 10: 10) were estmated as 0. 749, 0. 739, 0. 748 and 0. 890 respectvely. Senstvty of models were calculated as 0. 483, 0. 677, 0. 453 and 0. 863 and ther specfcty as 0. 857, 0. 660, 0. 910 and 0. 844 respectvely. The Kappa statstcs for these models were 0. 322, 0. 363, 0. 372 and 0. 712 respectvely. Concluson: Results of ths study ndcate that artfcal neural network models perform better than classc statstcal models n predctng the metabolc syndrome. Keywords: Artfcal Neural Network, Logstc Regresson, Dscrmnant Analyss, Metabolc syndrome